Световни новини без цензура!
Корай Кавукчуоглу от Google: Превръщане на абстрактното AI мислене в удобни за потребителя продукти
Снимка: ft.com
Financial Times | 2026-01-07 | 08:14:55

Корай Кавукчуоглу от Google: Превръщане на абстрактното AI мислене в удобни за потребителя продукти

Корай Кавукчуоглу е основен софтуерен шеф на DeepMind и основен проектант на AI на Гугъл.

Той управлява работата по създаването на Gemini 3, най-новия огромен езиков модел (LLM) на компанията Big Tech, който беше пуснат през ноември. Една от новите функционалности на модела е, че може да основава интерактивни приложения и уиджети въз основа на потребителски поръчки за търсене.

Възможностите на новия LLM впечатлиха противниците, като накараха основния изпълнителен шеф на OpenAI Сам Алтман да разгласи „ червен код “ за нуждата от възстановяване на ChatGPT, известния чатбот на неговата компания, и настигане на Гугъл.

Предимството на Гугъл е, че компанията има цялостния пакет от AI, което значи, че разполага с хардуера, центровете за данни, чиповете и всички други детайли, които разрешават гранични проучвания на ИИ. След това може да пусне всевъзможни нови артикули напряко към голямата си потребителска база.

В диалог с кореспондента за изкуствен интелект на Financial Times Мелиса Хейкила, Кавукуоглу изяснява с какво Gemini 3 се откроява и по какъв начин може да помогне на Гугъл в конкуренцията за превъзходство с изкуствен интелект.


Мелиса Хейкила: Вие сте основен софтуерен шеф на DeepMind от началото 2024 година и предишното лято поехте новата роля на основен проектант на AI на Гугъл. Какво прави основният AI проектант?

Koray Kavukcuoglu: Ние построяваме в действителност фундаментална технология. И първият и главен фокус, който имам, е да се уверя, че нашето развиване на ИИ и нашите артикули са добре свързани между тях. 

Искаме да дадем опция на всички артикули в Гугъл, всички продуктови области в Гугъл да имат достъп до най-хубавата AI технология, която сътворяваме. И по този начин, в Гугъл DeepMind ние построяваме тази гранична технология [където] нашата цел е да изградим AGI [изкуствен общ разсъдък — машини, които надминават човешките качества и интелект]. Наистина е значимо да вършим това по отношение на потребителите и това се случва единствено посредством нашите артикули. И с цел да се случи това, нашите артикули би трябвало да имат достъп до нашата гранична технология.

Това е напълно нова технология, която изисква напълно нова инфраструктура, с цел да може да прави това в мащаб. И това са областите на фокус, които имам, позволявайки тази промяна, позволявайки тази инфраструктура, работа с продуктите, тъй че да имат достъп до най-хубавата технология и ние да можем да се свързваме с потребителите по най-хубавия метод.

MH: Помогнете ми да слага Gemini 3 в подтекст. За неспециалистите сме виждали доста нови модели на AI и всички те наподобяват като последователно развиване. Много хора, които не са AI, може би са чували, че GPT-5 на OpenAI е малко отчаяние. И по този начин, за какво Gemini 3 е огромна работа? И за какво това е огромна работа за Гугъл? И по какъв начин ви нарежда в конкуренцията с изкуствен интелект?

KK: От наша позиция е значимо, тъй като усещаме, че сме създали още една огромна стъпка в мултимодалното схващане, което е в действителност значимо за потребителите. Нашето наличие не е единствено в текст. Нашето наличие се предлага в разнообразни форми. Ето за какво NotebookLM [асистентът на Гугъл за проучване и водене на бележки с неестествен интелект] е доста известен, [защото] хората харесват . . . за [качване] на всевъзможни документи и след това . . . задавайте въпроси за [тях].

И по този начин, до момента в който усилваме тази способност . . . видеоклипове на хора, изображения, PDF файлове, всичко това, опцията да имате в действителност положително схващане за това е огромна стъпка. И се надявам, че нашите консуматори също ще виждат тази огромна стъпка във типа на отговорите, които получават, и типа на информацията, която получават.

Вторият е кодирането. Но кодирането не е единствено за софтуерни инженери. Все повече и повече кодирането е обвързвано и с учене.

[С генеративните потребителски интерфейси на Gemini], когато хората задават въпроси, те получават доста по-интуитивни отговори, отговори, които в действителност ги учат на място, дружно със симулации, дружно с дребни джаджи, от които могат да се учат и да опитват.

Мисля, че опцията да обръщате този тип концептуален и нереален напредък в в действителност осезаеми и въздействащи интерфейси и взаимоотношения за потребителите, е това, което ще има значение. Възможността да вършим това дружно с продуктите е неповторимата разлика, която имаме. Ние не просто пускаме моделите. Пускаме, дружно с продуктите, тези в действителност добре премислени потребителски интерфейси и взаимоотношения за потребителите и надграждаме целия цялостен стек, който имаме.

От инженерна позиция, с Antigravity [интегрираната среда за разработка на Гугъл, основана на AI], ние пускаме нов метод за създаване на код. Средата за разработка на код преди всичко [където софтуерът може да работи самостоятелно и без значение от човешкия вход] е огромна стъпка. И това е по този начин, тъй като моделите имат тази дарба, която фактически могат да извършват на това високо равнище, нереално равнище и да извършват като сътрудници. 

MH: Можете ли да ме преведете през проучванията и техническите открития, които разрешиха този модел?

KK: Има разнообразни области на механически вложения, които влизат в създаването на модела. Започва се с предварителна подготовка. Предварителното образование [при което моделът се образова върху набор от данни] е обвързвано най-вече с архитектурни усъвършенствания, тъй че да имате по-добра архитектура, да имате по-ефективна архитектура и да можете да разберете доста по-добре данните, които получавате, за които се обучавате. Подобрихме представянето си много доста. Наистина сме удовлетворени от способността ни да създадем това.

Предварителното образование ви дава капацитет, тъй като имате модел, който схваща данните, който [не само] улавя информацията в данните, само че и неговия капацитет. Начинът, по който се отразява в продуктите, е посредством образованието след образованието, където моделът се научава по какъв начин да взаимодейства с потребителите за този артикул.

От страна на образованието след образованието имахме няколко напредъка, които доведоха до агентно държание на високо равнище и опция за шифроване и схващане. Моделът знае, че за въпрос, който задавате, може би ще ви покаже таблица с изображения, които е намерил от мрежата при своето търсене.

Но за друга поръчка, която имате, той ще реши, че ще напише дребна стратегия, която да ви покаже симулация, джаджа. Така че моделът взема решение за тях. И всичко това е поради неговия . . . шифроване и благоприятни условия за сътрудници.

Всичко това се събира дружно от страна преди образованието, от страна след образованието, в цялата компания е това, което е разрешило всичко това.

MH: Изчислителната мощ, нужна за това, би трябвало да насълзи очите. Как печелите пари от това?

KK: Най-важното нещо е едно, нашият метод с цялостен стак. Мисля, че имаме неповторим метод там. Второ, ние работим върху това дружно с нашите артикули. Когато вършим всички проучвания, които вършим, развиването на граничните технологии, както и когато пускаме тези модели на нашите консуматори, всичко се основава на обстоятелството, че вършим това с нашите артикули, милиарди хора ги употребяват и виждаме къде е нуждата, по какъв начин хората желаят да ги употребяват.

И мисля, че това е огромното значимо нещо тук, където всяко гранично софтуерно развиване, което вършим, се управлява от сигнала, който получаваме от потребителите. Тази основа е това, което е значимо и друго за нас.

MH: Гугъл сподели, че Gemini 3 е първа стъпка към същински общоприет сътрудник и визията за това по какъв начин наподобяват сътрудниците. Това ли можем да чакаме да наподобява и да се усеща от изкуствения общ разсъдък?

KK: Не бих споделил това, с цел да бъда почтен с вас. Всичко, което вършим, е ориентирано към това. Очевидно се опитваме да изградим AGI. Това е нашата задача. Това е нашата цел. Но мисля, че едно нещо, което е в действителност, в действителност значимо за мен, е, че нямаме . . . рецептата по какъв начин да се построи AGI [защото към момента е проучване]. Ето за какво основаването на верните артикули, избирането на верните артикули и разбирането на потребителските сигнали е [това, което управлява нашето] софтуерно развиване.

Защото AGI ще бъде нещо потребно за потребителите. Трябва да бъде. Това се опитваме да изградим. И единственият метод да извършите това е да получите този сигнал от потребителите по виновен метод. Ето за какво, когато споделяме, че се опитваме да проектираме нашите модели през цялото време предвид на сигурността и сигурността, ние вършим това, само че по-късно вършим това и с нашите артикули.

И Гугъл има голяма, дълга и сполучлива история на постигане до милиарди консуматори. И ние разчитаме на това също по този начин да ни покаже къде са потребностите на потребителите, къде технологията в действителност би трябвало да реши проблемите на потребителите. И това е пътят към AGI, който се опитваме да изградим.

MH: Вие също казахте, че Gemini 3 заобикаля клишетата и ласкателствата, което е обща характерност на генеративните AI модели. по какъв начин? Какво направихте?

KK: Личността на моделите е значима. Има доста диалози към това по какъв начин хората биха желали да се усещат моделите. Мисля, че едно преимущество, което имаме, е, че работим както с външни сътрудници, компании, по този начин и с вътрешни артикули. Всеки артикул също има малко своя вътрешна личност. Това, което направихме, е доста проучвания за това по какъв начин можем да определим количествено личността на един модел. Подлизурството е едно от тези измерения, които преглеждаме. Не мисля, че някой може да твърди, че имаме златно решение тук.

Но считаме, че сме подхванали стъпки към разбирането по какъв начин да създадем модел, който е управляем и който е потребен в необятен диапазон от области. Едно от значимите неща е моделите да дават информацията, която потребителите желаят, без прекалено много каскада към това или прекалено много хвалебствие към това.

В някои случаи би трябвало да се употребява. В доста случаи знаем, че не е належащо.

MH: Как бихте описали личността на Gemini 3?

KK: Не е наложително да кодираме личността за Gemini. Разбира се, след образованието всичко зависи от потребителския опит. Но за нас това е повече за опциите и истинността и с този елементарен език.

MH: И по-общо по отношение на проучванията на AI и полето, какво ви вълнува в AI сега като академик?

KK: Точно в този момент всичко върви бързо. Върви бързо, тъй като виждаме въздействието на моделите, които имат в случаите на приложимост в действителния свят. Хората употребяват тези модели за своята работа, за своето учене, за своето обучение и оказват влияние.

За мен най-вълнуващите неща се случват, до момента в който се учим по какъв начин да вършим по-добри сътрудници от тези модели. Защото, когато споделяме сътрудници, доста хора мислят единствено за кодиращи сътрудници, само че това е единствено един аспект. Става въпрос за това по какъв начин се употребяват те и в кои елементи от живота си разчитате на тях.

Ученето е частта, от която в действителност, в действителност се вълнувам. Защото това, което виждаме, е, че внезапно можете да получите доста по-богато взаимоотношение със наличието, което е там. Така че можем да свържем това наличие с потребителите по доста по-богат метод. И защото се подобряваме с сътрудниците, мисля, че ще виждаме това повече.

MH: Какво можем да чакаме по-нататък?

KK: Положихме шест месеца старания в създаването на модела [Gemini 3], надграждайки върху Gemini 2.5, интегрирайки всички сигнали и опит, които получаваме от потребителите, и по-късно изградихме този. Ще получим противоположна връзка от всевъзможни разнообразни общности, от потребителите до . . . разработчици и предприятия. Фокусът ни в действителност ще бъде върху разбирането на това.

Неизбежно ще има пропуски и по-късно затварянето на тези пропуски. И посредством това ще разберем кои са значимите проблеми, които хората се пробват да решат. Защото откакто постигнете някакво равнище на качество или акуратност във вашите модели, тогава хората в действителност го прокарват по по-трудни способи, доста изобретателно. Така че идващото е да се учим от тази креативност.

Този дубликат е редактиран за краткост и изясненост

Източник: ft.com


Свързани новини

Коментари

Топ новини

WorldNews

© Всички права запазени!